Introdução

Este trabalho compara duas fontes de estimativa de um indicador de qualidade do AR(PM2.5) no estado do Espírito Santo(ES):

O PM2.5 é considerado um dos principais indicadores da qualidade do ar e uma das formas de poluição mais perigosas para a saúde humana.

PM: Sigla para Particulate Matter, ou Material Particulado. Refere-se a uma mistura complexa de partículas minúsculas (sólidas e líquidas) que estão suspensas no ar.

2,5 micrômetros (µm) ou menos de diâmetro.

  1. Modelo CAMS: O CAMS é um serviço operacional de monitoramento global, combinando uma simulação computacional com observações reais (satélite + solo) para criar um conjunto de dados global e consistente sobre a qualidade do ar.

  2. Modelo Donkelaar: O modelo van Donkelaar é um método estatístico avançado que traduz medições visuais de satélite em concentrações de PM2.5 no solo, usando estimativas históricas para garantir eficiencia.

Objetivo: Avaliar a correlação, concordância e as diferenças entre os dois modelos para os anos de 2022 e 2023.

Trazendo uma perspectiva do estado do Espirito Santo(ES), se espera uma concentração maior de poluição do AR na região mais metropolitana que é o Centro junto a capital Vitória, assim como esperava-se menos poluição na região Norte por ser mais região de mata.

DADOS

Há uma diferença exclamativa nos dados, visto que os dados do modelo cams são diários, já no modelo donkelaar os dados estão agrupdos em estatistica descritivas(media, desvio padrão, etc) por mês, ambos para cada municipio em determinado ano

Assim a principal métrica adotada para os estudos foi a media do mês do pm2.5

Descrevendo um pouco de informação aos meses:

Em ambos os anos conseguimos observar que os valores de PM2.5 no método CAMS estão muito mais concentrados.

Tambem note-se que em janeiro e fevereiro os limites do nível de PM2.5 são maiores o que pode estar relacionado com a estação visto que são os meses de maior impacto do verão.

Em 2023 no meio do ano os métodos ficaram mais igualitários.

já podemos notar uma diferença dos métodos empiricamente, mas conotaremos uma medição para essa relação

Mapas

Olhando pro recorte anual, peguei o mapa do Espirito Santo para representar geográficamente a média anual do PM2.5 de cada modelo em cada municipio.

além dos modelos apresentamos a diferença entre os modelos em cada ano e a média dos 2 anos em cada modelo

utliizamos faixas conhecidas globalmente para classificar a medidade de poluição no AR PM2.5, são elas:

## [1] "0-5: Ideal"        "5-10: Bom"         "10-15: Aceitável" 
## [4] "15-20: Moderado"   "20-25: Ruim"       "25-30: Muito Ruim"
## [7] "30-35: Perigoso"   "35+: Crítico"

Modelo CAMS:

Em ambos os anos no modelo CAMS a suma maioria dos municipios tiveram classificação BOM, salvo alguns na região central em 2022 que tiveram classificação aceitável.

Modelo Donkelaar:

Já no Donkelaar temos um maior nível de PM2.5 pela região Sul. vemos o maior valor de poluição alcançado na cidade de Vitória, capital do estado.

Diferença entre os modelos em cada ano:

Pelos resultados já esperava-se que ficaria igual seguindo as faixas conhecidas

Sendo mais incisivo com a classificação de poluição para as médias dos anos pra cada modelo decidi retirar as faixas desagregando os municipios.

Na media dos anos fica mais explicito que há uma concentração maior de poluição do AR pela região central e na parte metropolitana da cidade perto de vitoria

Resumo

Alguns dados interessantes sobre o estado do Espirito Santo:

Resumo das Métricas de PM2.5 (2022-2023)
2022 2023
media_donk 9.958505 9.300144
desvio_padrao_donk 1.619843 1.789296
max_donk 14.55857 16.32374
municipio_max_donk Vitória Vitória
min_donk 7.159964 6.128573
municipio_min_donk Mucurici Pedro Canário
media_cams 8.472840 7.379759
desvio_padrao_cams 1.1307607 0.9098515
max_cams 10.752730 9.016256
municipio_max_cams Domingos Martins Venda Nova do Imigrante
min_cams 6.265517 5.451837
municipio_min_cams Linhares Conceição da Barra
media_diff 1.688852 1.920385
desvio_padrao_diff 1.172419 1.244632
max_diff 6.341410 8.989046
municipio_max_diff Vitória Vitória
min_diff 0.03495796 0.15809982
municipio_min_diff Pancas Pedro Canário

Análise de Dispersão

No gráfico de dispersão cada posição está relacionado a um valor de PM2.5 de cada método pra cada mês de um certo municipío

Pelo posição de cada perfil, e a linha de regressão vê que fica claro que tem uma correlação, até mesmo por diversos parametros estarem iguais em ambos os metodos, elas seguem um angulo plausível ao compreendimento de que há uma relação

Correlação

## 
##  Pearson's product-moment correlation
## 
## data:  dispersao22$Donkelar and dispersao22$cams
## t = 16.612, df = 934, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.4265454 0.5255657
## sample estimates:
##       cor 
## 0.4775707
## [1] 0.4775707
## 
##  Spearman's rank correlation rho
## 
## data:  dispersao22$Donkelar and dispersao22$cams
## S = 69622923, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.4905795
## 
##  Pearson's product-moment correlation
## 
## data:  dispersao23$Donkelar and dispersao23$cams
## t = 11.526, df = 934, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.2954888 0.4077439
## sample estimates:
##       cor 
## 0.3528855
## [1] 0.3528855
## 
##  Spearman's rank correlation rho
## 
## data:  dispersao23$Donkelar and dispersao23$cams
## S = 78682568, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.4242914

A conclusão principal é que existe uma relação positiva e estatisticamente significante entre os métodos “Donkelaar” e “cams” nos dois anos, mas essa relação foi visivelmente mais fraca em 2023 do que em 2022.

ambos os testes deram uma correlação moderada entre os metodos.

Gráfico de Bland-Altman

Em ambos os anos, o modelo “Donkelar” mede, sistematicamente, valores mais altos que o “cams” (um viés positivo).

No entanto, o padrão desse erro mudou drasticamente:

Em 2022, a diferença era consistente (viés uniforme).

Em 2023, a diferença explodiu em dias de alta poluição (viés proporcional).

Isso explica perfeitamente por que sua correlação foi mais fraca em 2023 (r=0.35) do que em 2022 (r=0.48).

Medida de Concordância

##  Single Score Intraclass Correlation
## 
##    Model: twoway 
##    Type : consistency 
## 
##    Subjects = 936 
##      Raters = 2 
##    ICC(C,1) = 0.396
## 
##  F-Test, H0: r0 = 0 ; H1: r0 > 0 
##  F(935,935) = 2.31 , p = 8.3e-37 
## 
##  95%-Confidence Interval for ICC Population Values:
##   0.34 < ICC < 0.448
##  Single Score Intraclass Correlation
## 
##    Model: twoway 
##    Type : agreement 
## 
##    Subjects = 936 
##      Raters = 2 
##    ICC(A,1) = 0.334
## 
##  F-Test, H0: r0 = 0 ; H1: r0 > 0 
##   F(935,54) = 2.31 , p = 0.000112 
## 
##  95%-Confidence Interval for ICC Population Values:
##   0.163 < ICC < 0.469
##  Single Score Intraclass Correlation
## 
##    Model: twoway 
##    Type : consistency 
## 
##    Subjects = 936 
##      Raters = 2 
##    ICC(C,1) = 0.28
## 
##  F-Test, H0: r0 = 0 ; H1: r0 > 0 
##  F(935,935) = 1.78 , p = 1.17e-18 
## 
##  95%-Confidence Interval for ICC Population Values:
##   0.22 < ICC < 0.338

Ambos os anos tiveram um teste de concordância < 0.50: Concordância Ruim

Um valor de 0.334 é classificado como “Ruim”. Isso prova que, se você pegar uma medição do Donkelar e uma do cams para o mesmo dia e local, elas não serão iguais. A concordância nos valores absolutos é baixíssima.

Conclusão

O ICC de Consistência (Consistency) = 0.396 e suas Correlações (r = 0.48 e r = 0.35). Mesmo se esquecermos os valores absolutos e apenas perguntarmos: “Quando o Donkelaar sobe, o Cams também sobe?”, a resposta é “apenas mais ou menos”. Um valor de 0.396 também é classificado como “Ruim”. Isso mostra que os modelos não seguem confiavelmente o mesmo padrão de poluição.

Viés Sistemático (Erro Fixo): O gráfico de 2022 mostra que a linha de diferença média (linha azul) está sempre acima de zero. Isso prova que o Donkelar reporta, sistematicamente, valores mais altos que o cams.

Viés Proporcional (Erro Variável): O gráfico de 2023 mostra um padrão de “cone”. Isso prova que a discordância piora à medida que a poluição aumenta. Em dias limpos, eles quase concordam, mas em dias muito poluídos, o Donkelar reporta valores drasticamente mais altos que o cams.

Os modelos Donkelar e cams não medem a mesma coisa. A análise quantitativa (ICC = 0.334) prova que a concordância absoluta é ruim. A análise visual (Bland-Altman) explica o porquê: o modelo Donkelar apresenta um viés positivo (mede a mais) que se torna proporcionalmente maior em dias de alta poluição.